[スポンサーリンク]

分析化学

PythonとChatGPTを活用するスペクトル解析実践ガイド

[スポンサーリンク]

概要

ケモメトリクスと機械学習によるスペクトル解析を、Pythonの使い方と数学の基礎から実践まで一気通貫で解説。サポートページのソースコードですぐに始められる。
プログラムの解説動画を購入者限定で無料公開。(引用:講談社サイエンティフィック

対象者

  • スペクトルを取り扱う研究者,データサイエンティスト
  • 意欲ある大学生

目次

第1章 スペクトル解析の基礎知識
1.1 機器分析
1.2 分光分析とスペクトル
1.3 スペクトル解析
1.4 従来のスペクトル解析とPythonによるスペクトル解析
1.5 Pythonを使用する利点
1.6 機械学習とケモメトリクスのスペクトル解析への適用
1.6.1 機械学習とは
1.6.2 ケモメトリクスとは
1.6.3 ケモメトリクスと機械学習の違い
1.6.4 スペクトル解析における相関と因果の区別の重要性
1.6.5 検量線と検量モデル
1.7 相関と因果
1.8 ノーフリーランチ定理
コラム1:公理と定理

第2章 Pythonプログラミングの導入と基礎
2.1 Python(Jupyter Notebook)の環境構築
2.2 GitHubからのデータのダウンロード
2.3 Pythonプログラミング入門
2.3.1 キーボードショートカットとMarkdown
2.3.2 変数の取り扱い
2.3.3 リスト
2.3.4 タプル
2.3.5 bool型
2.3.6 if文
2.3.7 for文
2.3.8 関数の定義
2.4 ライブラリ
2.4.1 ライブラリとは
2.4.2 ライブラリのインストールとインポート
2.4.3 Pythonとライブラリのバージョンについて
2.4.4 ライブラリの利用方法

第3章 Pythonで理解する基礎統計
3.1 平均,分散,標準偏差
3.2 正規分布
3.3 データフレームの取り扱い
3.3.1 データフレームの作成
3.3.2 インデックスがないデータ
3.3.3 インデックスもカラム名もないデータ
3.3.4 データフレームの操作
3.4 pandasで正規分布を理解する
3.4.1 平均値と標準偏差の計算
3.4.2 ヒストグラムと正規分布のグラフの作成
3.4.3 Zスコアを用いた統計的指標の計算
3.5 母集団と標本,偶然誤差と系統誤差
3.6 点推定
3.7 区間推定
3.7.1 母集団の分散が既知の場合の信頼区間の求め方
3.7.2 母集団の分散が未知の場合の信頼区間の求め方
3.7.3 母集団の信頼区間の推定
3.8 対応のあるt検定
3.9 対応のないt検定
3.10 相関係数とp値

第4章 Pythonで理解する線形代数
4.1 行列の基本演算
4.1.1 行列の和,差,積
4.1.2 単位行列と逆行列
4.1.3 Pythonを用いた行列の基本演算
4.2 逆行列で連立方程式を解く
4.2.1 逆行列を用いた連立方程式の解き方
4.2.2 Pythonによる行列を用いた連立方程式の解き方
4.2.3 逆行列が求まらない連立方程式
4.2.4 単回帰分析(最小二乗法)
4.2.5 Python による単回帰分析(最小二乗法)
4.3 DataFrame(pandas)とndarray(NumPy)の関係
コラム2:バタフライ効果(グーテンベルグ・リヒター則と偶然性)

第5章 ChatGPTの効果的な使い方
5.1 ChatGPTの概要
5.2 ChatGPTの機能
5.2.1 プラグイン
5.2.2 ウェブブラウジング
5.2.3 Advanced data analysis
5.2.4 DALL‒E画像生成
5.2.5 MyGPTs
5.3 プロンプトエンジニアリング
5.3.1 プログラムの理解
5.3.2 プログラムのデバッグ
5.3.3 プログラムの更新
5.3.4 プログラムの生成
コラム3:社会学(相関と蓋然性)

第6章 ケモメトリクスの基礎知識
6.1 ランベルト・ベール則
6.2 古典的最小二乗(CLS)法
6.2.1 ランベルト・ベール則を拡張する
6.2.2 純スペクトル行列を解く(CLS 法)
6.2.3 CLS法の問題点
6.2.4 CLS法の実装
6.3 逆最小二乗(ILS)法
6.3.1 ILS法の特徴
6.3.2 ILS法の計算と欠点
6.3.3 ILS法の実装

第7章 ケモメトリクスの基礎知識:応用編
7.1 主成分分析(PCA)
7.1.1 PCAの概念
7.1.2 ローディングの性質
7.1.3 PCAローディングの性質をPython確認する
7.1.4 PCAと固有値問題(特異値分解)
7.1.5 中心化と標準化がローディングに与える影響
7.1.6 中心化と標準化がローディングに与える影響をPythonで確認する
7.1.7 スコアとローディングによるスペクトルの再構築
7.1.8 スコアとローディングによるスペクトルの再構築をPythonで確認する
7.1.9 主成分回帰(PCR)と最適な主成分数の決定(バリデーション)
7.1.10 クロスバリデーションとテストセット
コラム4:正確度と精度
7.2 部分的最小二乗回帰(PLS回帰)
7.2.1 PLS回帰の概要
7.2.2 ウェイトローディングとローディングの違い
7.2.3 ウェイトローディングとローディングの違いをPythonで確認する
7.3 スペクトル分解としてのケモメトリクス
コラム5:医療と治験

第8章 スペクトルデータの前処理
8.1 スペクトルデータの一括読み込み
8.2 横軸の間隔が異なるスペクトル
8.3 行方向(試料方向)の前処理
8.3.1 中心化と標準化
8.3.2 乗算的散乱補正(MSC)
8.4 列方向(波長方向)の前処理
8.4.1 スムージング,一次微分,二次微分による前処理
8.4.2 スムージング,一次微分,二次微分による前処理の実行
8.4.3 標準正規変量(SNV)による前処理の実行
8.5 前処理の関数のモジュール化
コラム6:ビッグデータとGAMAM

第9章 機械学習の基礎知識
9.1 クラスタリング
9.2 k近傍法
9.3 決定木をベースとしたアルゴリズム
9.3.1 ランダムフォレスト
9.3.2 勾配ブースティング
9.3.3 Pythonによる実践
9.4 重回帰分析(最小二乗法,最小絶対値法,リッジ回帰,ラッソ回帰)
9.5 サポートベクトルマシン(SVM)
9.5.1 SVMの損失関数
9.5.2 SVM(ハードマージン)の条件
9.5.3 SVM(ソフトマージン)の条件
9.5.4 主問題と双対問題(カーネル化と非線形判別分析)
9.5.5 SVM による非線形判別分析の実践
9.5.6 サポートベクトル回帰(SV回帰)
9.5.7 スペクトルに現れる非線形項
9.6 ニューラルネットワーク(NN)
Appendix SVM の主問題から双対問題への変換

第10章 スペクトル操作の実践
10.1 スペクトルデータの読み込み
10.2 箱ひげ図による目的変数の分布の把握
10.3 スペクトル表示
10.4 ピーク検出
10.5 相関スペクトル
10.6 ベースライン補正
10.7 カーブフィッティング
10.8 ヒートマップによるスペクトル表示

第11章 ケモメトリクスと機械学習の実践
11.1 アウトライヤーの検出と除去
11.2 各モジュールでの標準化自由度
11.3 PLSウェイトローディング,ローディング,回帰係数
11.4 ウェイトローディングと寄与率
11.5 GridSearchCVによるクロスバリデーション
11.6 パイプイラインを用いたモデルの最適化

第12章 ハイパースペクトルイメージング解析
12.1 RGB画像とハイパースペクトルイメージング(HSI)
12.2 NIR‒HSIデータの構造と読み込み
12.3 画像とスペクトルの抽出
12.4 木材試料領域のスペクトルと画像を抽出
12.4.1 任意の波長領域でのHSIとスペクトルの抽出
12.4.2 試料領域の抽出
12.5 PLS回帰を用いた目的変数の予測値の空間分布を可視化
12.6 HSIデータ解析への畳み込みニューラルネットワーク(CNN)の適用

あとがき
索引

・全320ページ

内容

様々な科学的機器を駆使して物質の物理的・化学的な分析を行うことを機器分析といいます。その中でも物質の光の吸収・放出を測定する分光分析は,物質の特性や濃度を把握するために,化学・生物・物理など多くの分野において活用されています。

分光分析においては,光の波長や周波数に応じた物質の応答(吸収・発光)の分布を考えることが多く,これは物質固有の特性を反映します。
このような分布をスペクトルと呼び,皆さんも1度は見たことのあるものだと思います (図1) 。

図1. オクタンのIRスペクトル(SDBSより引用)

単純な物質のスペクトルであればスペクトル測定装置に付属する専用のソフトウェアを用いて解析を行うだけで十分だと思われます。
多くの場合,専用のソフトウェアにはピークピッキング,カーブフィッティング,スペクトル分解といった基本的な解析機能を搭載しているためです。

しかしながら,複雑なスペクトルデータの解析や,大量のデータを扱う場合には,従来のソフトウェアでは対応できないことがあります。
これを補うためのソフトウェアも販売されてきましたが,新しい手法やアルゴリズムの適用にはアップデートが必要なことが多く,研究の妨げになることが多いです。

そのためスペクトルに対してケモメトリクスや機械学習を適用することで,定量・分類を皆さん自身の力で行うことが必要となり,本書はそれらの理論と実践の両方を丁寧に解説してくれます。

構成

皆さん自身がプログラムを駆使して解析を自由自在にできるようになるためには

  • プログラミング(Python)
  • 統計
  • ケモメトリクスと機械学習
  • スペクトル
  • 試料

などについて学ぶ必要があります。
本書では以上の内容を,初学者の人でも分かるように,丁寧な図解付きでプログラミングや統計学について解説してくれます。
私は主成分分析についてなんとなくの雰囲気を知っているだけで,自分でプログラミングすることはできない状態でしたが,本を読みながら基礎となる理論とプログラムの実装の仕方を学ぶことでしっかりを身につけることができました。

ChatGPTを活用しよう

プログラムを扱う上で今やChatGPTなどの大規模言語モデル (LLM) に基づく対話型生成AIは必須のツールとなりました。
本書ではChatGPTの概要から機能,そしてプロンプトエンジニアリングまで解説してくれます。
(ChatGPTに質問する文章のことをプロンプトと言い,これを工夫して目的の応答を得ること目指すことをプロンプトエンジニアリングと言います。)

例えば逆最小二乗 (ILS) 法によって,ある混合物の吸収スペクトルデータと既知の濃度データから,成分ごとの濃度を予測することプログラムを作成することを考えます。

何も考えずにChatGPTに対してプロンプトを投げて,プログラムを出力してもらうと,回答が間違える場合や,希望の回答が得られない場合があります。
本書では,そのようなミスを少なくするために,プロンプトの作成の仕方から学びます

また,希望の回答が得られた場合であっても,出力されたコードを正しく理解する必要があり,時間がかかってしまいます。
ChatGPTから出力されたコードでなくとも,他の人が作成したコードを理解することは難しいことが多いです。
そのような時でもChatGPTを活用することで,プログラムを素早く理解することができ,本書ではその方法についても学びます。

最後に,実際にコードを動かすと少々のデバッグ (プログラムのエラーや不具合を特定し,修正すること) が必要になることが多いです。
デバッグは非常に煩雑な作業ですが,適切なプロンプトを作成することで,ここでもChatGPTは強力な味方になってくれます。

本書ではILS法だけでなく,多くの手法や問題を取り上げながら,その1つ1つのプログラムの実装の仕方やChatGPTの使い方について解説してくれます。

関連書籍

関連記事

  1. リビングラジカル重合ガイドブック -材料設計のための反応制御-
  2. 一流ジャーナルから学ぶ科学英語論文の書き方
  3. 次世代医薬とバイオ医療
  4. 【書籍】有機スペクトル解析入門
  5. 持続可能な社会を支えるゴム・エラストマー:新素材・自己修復・強靱…
  6. 有機合成のための遷移金属触媒反応
  7. 2008年12月人気化学書籍ランキング
  8. 理系のためのフリーソフト Ver2.0

注目情報

ピックアップ記事

  1. 第16回 Student Grant Award 募集のご案内
  2. 【速報】2012年ノーベル化学賞発表!!「Gタンパク質共役受容体に関する研究」
  3. 【書籍】りょうしりきがく for babies
  4. ぼっち学会参加の極意
  5. アルキンの水和反応 Hydration of Alkyne
  6. 塩基と酸でヘテロ環サイズを”調節する”
  7. 軽量・透明・断熱!エアロゲル(aerogel)を身近に
  8. ESI-MSの開発者、John B. Fenn氏 逝去
  9. 2010年イグノーベル賞決定!
  10. 超分子ポリマーを精密につくる

関連商品

ケムステYoutube

ケムステSlack

月別アーカイブ

2025年3月
 12
3456789
10111213141516
17181920212223
24252627282930
31  

注目情報

最新記事

第23回次世代を担う有機化学シンポジウム

「若手研究者が口頭発表する機会や自由闊達にディスカッションする場を増やし、若手の研究活動をエンカレッ…

ペロブスカイト太陽電池開発におけるマテリアルズ・インフォマティクスの活用

持続可能な社会の実現に向けて、太陽電池は太陽光発電における中心的な要素として注目…

有機合成化学協会誌2025年3月号:チェーンウォーキング・カルコゲン結合・有機電解反応・ロタキサン・配位重合

有機合成化学協会が発行する有機合成化学協会誌、2025年3月号がオンラインで公開されています!…

CIPイノベーション共創プログラム「未来の医療を支えるバイオベンチャーの新たな戦略」

日本化学会第105春季年会(2025)で開催されるシンポジウムの一つに、CIPセッション「未来の医療…

OIST Science Challenge 2025 に参加しました

2025年3月15日から22日にかけて沖縄科学技術大学院大学 (OIST) にて開催された Scie…

ペーパークラフトで MOFをつくる

第650回のスポットライトリサーチには、化学コミュニケーション賞2024を受賞された、岡山理科大学 …

月岡温泉で硫黄泉の pH の影響について考えてみた 【化学者が行く温泉巡りの旅】

臭い温泉に入りたい! というわけで、硫黄系温泉を巡る旅の後編です。前回の記事では群馬県草津温泉をご紹…

二酸化マンガンの極小ナノサイズ化で次世代電池や触媒の性能を底上げ!

第649回のスポットライトリサーチは、東北大学大学院環境科学研究科(本間研究室)博士課程後期2年の飯…

日本薬学会第145年会 に参加しよう!

3月27日~29日、福岡国際会議場にて 「日本薬学会第145年会」 が開催されま…

TLC分析がもっと楽に、正確に! ~TLC分析がアナログからデジタルに

薄層クロマトグラフィーは分離手法の一つとして、お金をかけず、安価な方法として現在…

実験器具・用品を試してみたシリーズ

スポットライトリサーチムービー